期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 融合双向依存自注意力机制的神经机器翻译
李治瑾, 赖华, 文永华, 高盛祥
《计算机应用》唯一官方网站    2022, 42 (12): 3679-3685.   DOI: 10.11772/j.issn.1001-9081.2021101805
摘要261)   HTML13)    PDF (961KB)(120)    收藏

针对神经机器翻译中资源稀缺的问题,提出了一种基于双向依存自注意力机制(Bi-Dependency)的依存句法知识融合方法。首先,利用外部解析器对源句子解析得到依存解析数据;然后,将依存解析数据转化为父词位置向量和子词权重矩阵;最后,将依存知识融合到Transformer编码器的多头注意力机制上。利用Bi-Dependency,翻译模型可以同时对父词到子词、子词到父词两个方向的依存信息进行关注。双向翻译的实验结果表明,与Transformer模型相比,在富资源情况下,所提方法在汉-泰翻译上的BLEU值分别提升了1.07和0.86,在汉-英翻译上的BLEU值分别提升了0.79和0.68;在低资源情况下,所提方法在汉-泰翻译上的BLEU值分别提升了0.51和1.06,在汉-英翻译上的BLEU值分别提升了1.04和0.40。可见Bi-Dependency为模型提供了更丰富的依存信息,能够有效提升翻译性能。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 融合单语语言模型的汉越伪平行语料生成
贾承勋, 赖华, 余正涛, 文永华, 于志强
计算机应用    2021, 41 (6): 1652-1658.   DOI: 10.11772/j.issn.1001-9081.2020071017
摘要332)      PDF (1333KB)(303)    收藏
神经机器翻译在资源丰富的语种上取得了良好的翻译效果,但是由于数据稀缺问题在汉语-越南语这类低资源语言对上的性能不佳。目前缓解该问题最有效的方法之一是利用现有资源生成伪平行数据。考虑到单语数据的可利用性,在回译方法的基础上,首先将利用大量单语数据训练的语言模型与神经机器翻译模型进行融合,然后在回译过程中通过语言模型融入语言特性,以此生成更规范质量更优的伪平行数据,最后将生成的语料添加到原始小规模语料中训练最终翻译模型。在汉越翻译任务上的实验结果表明,与普通的回译方法相比,通过融合语言模型生成的伪平行数据使汉越神经机器翻译的BLEU值提升了1.41个百分点。
参考文献 | 相关文章 | 多维度评价
3. 基于灰色关联分析的中文新闻事件关联性识别
刘盼盼, 洪旭东, 郭剑毅, 余正涛, 文永华, 陈玮
计算机应用    2016, 36 (2): 408-413.   DOI: 10.11772/j.issn.1001-9081.2016.02.0408
摘要407)      PDF (895KB)(883)    收藏
针对中文新闻事件关联性识别准确率较低的问题,提出一种基于灰色关联分析(GRA)的中文新闻事件关联性识别算法,该算法是一种多因素分析法。首先,通过分析中文新闻事件的特性,提出三个影响事件关联性的因素,分别为触发词的共现性、事件的共享名词以及事件句的相似度;其次,对多个影响因素进行量化处理,计算每个影响因素的影响权值;最后,运用GRA将多个影响因素结合在一起,建立事件之间的灰色关联性分析模型,实现事件关联性识别。通过实验验证了三个影响因素对事件关联性识别的有效性,而且相对于只考虑单一影响因素的关联性识别算法,所提算法提高了事件关联性识别的准确率。
参考文献 | 相关文章 | 多维度评价